什麼是向量資料庫呢?
可以把文字變成數字儲存起來的地方。也就是把人類的語言轉換成數字,好讓電腦理解。
為什麼要用Chroma?
它是個一個常見的向量資料庫,還有FAISS (Meta)、Weaviate……等。
在開發 AI 應用,特別是 RAG(檢索增強生成)架構時,向量資料庫就扮演了關鍵的角色: 儲存經向量化的資料,並進行語意相似度檢索。
我來介紹Chroma如何使用:
安裝 pip install chromadb,可用於本地端
建立PersistentClient(這是新版用法)
建立 collection: 所有的資料都放在裡面
新建兩個文件和文本訊息
以”AI” 這關鍵詞去搜尋,查詢語意最相似的文件
就是最後輸出的樣子
代表已經找到在文件 ID 為 "doc1"、文件為’AI的應用很廣'、metadatas為'source': 'A'的地方
是不是很簡單呢?
明天會介紹rag~~